Control de posición de quadrotor con aprendizaje por refuerzo SAC
Aprende cómo SAC (Soft Actor-Critic) mejora el control de posición de quadrotors, con entrenamiento más rápido y seguimiento de rutas más suave.
Aprende cómo SAC (Soft Actor-Critic) mejora el control de posición de quadrotors, con entrenamiento más rápido y seguimiento de rutas más suave.
El suelo energético en HVAC con SAC es de $35.51/día. El buffer de repetición inicial causa un 4.7% de sobrecosto. Aprende a optimizarlo.
ZAPS-DA: reduce hasta 21x la vibración en acciones sin retardo ni filtros. Probado en MetaDrive y Webots. ¡Mejora el control continuo en RL!